Сметанин Юрий Геннадиевич - доктор физико-математических наук, главный научный сотрудник, Вычислительный центр им. А.А.Дородницына, Российская академия наук. Адрес: 119333, Москва, ул. Вавилова, 40. E-mail: smetanin.iury2011@yandex.ru
Ульянов Михаил Васильевич - доктор технических наук, профессор кафедры прикладной математики и моделирования систем, Институт коммуникаций и медиабизнеса, Московский государственный университет печати им. Ивана Федорова; профессор кафедры управления разработкой программного обеспечения, департамент программной инженерии, факультет компьютерных наук, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: muljanov@mail.ru
В настоящее время рассматриваются разнообразные подходы к исследованию временных рядов в аспекте их прогнозирования. По мнению авторов, интерес представляет подход кластерного анализа, в котором объектом исследования является множество временных рядов, порожденных различными источниками. Пространство кластеризации строится на основе обобщенных универсальных характеристик временных рядов, каждая из которых является координатой этого пространства. Одному временному ряду в таком пространстве соответствует точка в координатах универсальных характеристик. Применение методов кластерного анализа позволяет выделить временные ряды, близкие по метрике пространства, а для полученных кластеров возможно решение задачи о выборе рационального метода прогнозирования. Построение специального метрического пространства для анализа временных рядов является объектом исследования данной статьи. Предметом исследования являются координаты этого пространства – обобщенные характеристики временных рядов. Авторами в ряде предыдущих работ уже были введены две координаты такого пространства – сложность временного ряда по Колмогорову и гармоническая сложность временного ряда. Настоящая статья посвящена разработке новой обобщенной характеристики временного ряда с использованием аппарата комбинаторики слов – мере символьного разнообразия. Применение подхода символьного кодирования позволяет получить представление временных рядов в пространстве слов некоторого выбранного алфавита. Исследование полученного представления методами комбинаторики слов позволяет получить оценку энтропии сдвигов как функцию длины скользящего окна. На основе исследования особенностей первой конечной разности этой функции предлагается мера символьного разнообразия временного ряда. Предложенная обобщенная характеристика может быть использована для последующего выявления характерных особенностей временных рядов, в частности, как одна из осей пространства кластеризации.